info

การตอบสนองของ Google ต่อ OpenAI: การต่อสู้ของโครงการ Astra, Veo และ Gemini ในการพัฒนา AI

นี่คือการตอบสนองของ Google ต่อ OpenAI

AI ทั่วไป AI ที่สามารถใช้ได้จริงในชีวิตประจำวัน จะน่าอายแค่ไหนถ้าจะจัดงานแถลงข่าวถ้ามันไม่เป็นแบบนี้ในตอนนี้

ในเช้าตรู่ของวันที่ 15 พฤษภาคม งานประชุมผู้พัฒนา Google I/O ประจำปี "Spring Festival Gala of the Technology World" ได้เริ่มขึ้นอย่างเป็นทางการ AI ถูกกล่าวถึงกี่ครั้งใน 110 นาทีของการบรรยายหลัก? Google ได้ทำการนับแล้ว:

ใช่ AI ถูกพูดถึงทุกนาที

การแข่งขันของ AI ที่สร้างสรรค์ได้ถึงจุดสูงสุดใหม่แล้ว และเนื้อหาของการประชุม I/O นี้ก็เป็นไปตามแนวทางของ AI

“เมื่อปีที่แล้วบนเวทีนี้ เราได้แชร์แผนการสำหรับโมเดลขนาดใหญ่หลายรูปแบบที่เป็นพื้นฐาน Gemini เป็นครั้งแรก มันได้สร้างสรรค์ยุคใหม่ของ I/O” Sundar Pichai CEO ของ Google กล่าว “วันนี้เราหวังว่าทุกคนจะได้รับประโยชน์จากเทคโนโลยีของ Gemini ฟีเจอร์ที่ล้ำสมัยเหล่านี้จะซึมซาบเข้าสู่การค้นหา รูปภาพ เครื่องมือผลิตผล ระบบ Android และหลายๆ ด้าน”

ปัจจุบัน 1.5 Pro และ 1.5 Flash พร้อมให้ทดลองใช้สาธารณะและมีหน้าต่างบริบท 1 ล้าน token ใน Google AI Studio และ Vertex AI ตอนนี้ 1.5 Pro ยังมีหน้าต่างบริบท 2 ล้าน token สำหรับนักพัฒนาที่ใช้ API และลูกค้า Google Cloud ผ่านรายการรอ

นอกจากนี้ Gemini Nano ได้ขยายจากการป้อนข้อมูลข้อความบริสุทธิ์ไปยังการป้อนข้อมูลภาพ ในปีนี้ Google จะเปิดตัว Gemini Nano หลายรูปแบบเริ่มต้นด้วย Pixel ซึ่งหมายความว่าผู้ใช้มือถือไม่เพียงแต่สามารถประมวลผลข้อมูลข้อความ แต่ยังสามารถเข้าใจข้อมูลบริบทเพิ่มเติม เช่น ภาพ เสียง และภาษาที่พูด

ครอบครัว Gemini ยินดีต้อนรับสมาชิกใหม่: Gemini 1.5 Flash

1.5 Flash ใหม่ได้รับการปรับให้เหมาะสมสำหรับความเร็วและประสิทธิภาพ

โมเดลขนาดใหญ่โอเพนซอร์สรุ่นใหม่ Gemma 2

วันนี้ Google ยังได้เปิดตัวชุดการอัปเดตสำหรับโมเดลขนาดใหญ่โอเพนซอร์ส Gemma – Gemma 2 มาถึงแล้ว

ตามที่แนะนำ Gemma 2 ใช้สถาปัตยกรรมใหม่ที่มุ่งหวังจะบรรลุประสิทธิภาพและประสิทธิผลที่ก้าวล้ำ พารามิเตอร์โมเดลที่เปิดให้ใช้งานใหม่มีขนาด 27B

เมื่อพูดถึงวิดีโอที่ยาว Veo สามารถผลิตวิดีโอที่มีความยาว 60 วินาทีหรือมากกว่านั้นได้ มันสามารถทำได้ผ่านการป้อนข้อมูลเพียงคำเดียวหรือโดยการให้ชุดคำที่บอกเล่าเรื่องราวด้วยกัน นี่คือกุญแจสำคัญสำหรับการประยุกต์ใช้โมเดลการสร้างวิดีโอในผลิตภัณฑ์ภาพยนตร์และโทรทัศน์

Veo อิงจากงานของ Google ในการสร้างเนื้อหาภาพ รวมถึง Generative Query Network (GQN), DVD-GAN, Image-to-Video, Phenaki, WALT, VideoPoet, Lumiere และอื่นๆ